A轮,5800万美元,又一家零收入的私有大模型初创公司获投
笔者:这是在两周之内,继Mistral AI,MosaicML之后,第三家瞄准企业私有大模型的创业公司获投。可以说,在资金的加持下,企业私有大模型的竞争未来会如火如荼。 |
近日,由于其无与伦比的文本分析和生成能力,大模型备受瞩目。然而,对于希望利用大模型完成特定任务的企业而言,大模型的通用性可能成为一种负担。
当指令过于精确时,即使是最优秀的大模型也难以保持一致性。finetuning或缩小大模型的任务范围是解决这个问题的一个办法,但这在技术上具有相当的挑战性,更遑论高昂的成本。
为了寻找更简单的方法,DeepMind、谷歌、百度和Meta的一组研究人员成立了Reka。今天,这家初创公司以5800万美元的A轮融资低调亮相。由DST Global Partners和Radical Ventures领投,跟投包括战略合作伙伴Snowflake Ventures和前GitHub首席执行官Nat Friedman。
总部位于旧金山的Reka是由Dani Yogatama、Cyprien de Masson、Qi Liu Head和Yi Tay共同创立的。在研发包括DeepMind AlphaCode和Bard在内的大模型时,这几位创始人共同意识到一个问题:“期待一个通用大模型能够处理所有的Use Case是不切实际的”。
“我们理解人工智能的变革力量,并希望以负责任的方式将这项技术的益处带给世界,”Yogatama在接受TechCrunch的电子邮件采访时说。“Reka是一家研究和产品公司,开发旨在造福人类和企业的大模型。”
Reka的第一个商业产品Yasa并没有完全满足该雄心壮志(图1)。但它体现了这家初创公司的早期理念。除了文字之外,Yasa是一款多模态人工智能“助手”,经过训练可以理解图像、视频和表格数据。Yogatama说,它可以用来生成想法并回答基本问题,还可以从公司的内部数据中提取洞察力。
图1: Yasa
通过这种方式,处于封闭测试beta阶段的Yasa与GPT-4有诸多相似之处。但不同在于,Yasa可以轻松地根据私有数据和应用为企业进行个性化定制。
“在无需AI工程师团队的情况下,我们的技术能够使企业分享大模型进步的果实,同时满足企业私有环境的部署限制,” Yogatama表示。
Yasa仅仅是一个开始。接下来,Reka的重点是拓展其大模型多模态能力,能够生成和处理更多类型数据,并且能够做到自我演进:无需重新训练即可保证模型处于最新状态。
Reka当前还仅仅面向少数选定客户。在此之上,Reka还提供一项服务,即可以用企业的私有数据结合Yasa“提炼”开发定制大模型。之后,客户可以通过Reka的API在自己的基础架构上运行该“提炼”过的大模型。
值得注意的是,Reka并不是唯一一家专注于2B市场大模型的初创公司。Writer让企业客户可以依据自己的内容和风格对LLM进行微调,Contextual AI和LlamaIndex正在开发新工具,以便让企业可以将私有数据结合到大模型中,而Cohere则立足于定制训练大模型以满足企业客户的特殊需求。
作为竞争对手,像OpenAI这样的“老牌公”司现在也开始提供finetuning工具,并通过连接互联网和其他数据源,以保证ChatGPT处于最新状态。
但Reka的定位赢得了一位早期客户(也是投资者)Snowflake的支持,后者与该初创公司合作,使Snowflake客户可以从其账户中部署Yasa。大数据分析公司Appen最近也宣布,它正在与Reka合作,为企业构建由多模态大模型驱动定制应用。
当被问及为何投资Reka时,Radical Ventures的合伙人罗布·托伊斯(Rob Toews)表示:
“让Reka与众不同的是,其目标是帮助每个客户实现大模型的潜力,而不必担心大模型的通用性。Reka的Yasa模型可以让企业将数据保留在内部,这在成本和能源消耗方面非常高效,而且让企业省去高昂的从零构建大模型的研发费用和人力成本。
如果每个企业未来都需要大模型作为企业的“大脑”,那么Reka则志在为每个企业提供私有的、高质量的、产品级大模型。”
Yogatama表示,目前还没有任何收入的Reka将会用募到的资金来购买算力和建立销售团队。
原文来自:Reka emerges from stealth to build custom AI models for the enterprise | TechCrunch